تشخیص حس وابسته به گویندة گفتار فارسی با استفاده از ویژگی های آکوستیکی

نویسندگان

منصوره کرمی

پریا جمشیدلو

حسین صامتی

چکیده

بیان احساس در ارتباطات روزمره از جایگاه ویژه ای برخوردار است. از جمله بسترهای نمود احساس، گفتار است. از این رو، یکی از جنبه های مهم در طبیعی سازی ارتباط میان انسان و ماشین، تشخیص حس گفتار و تولید بازخورد متناسب با احساس درک شده است. باوجود پیشرفت های گسترده در حوزة پردازش گفتار، استخراج و درک احساس پنهان در گفتار انسان، همچون خشم، شادی و جز این ها، از یک سو و تولید گفتار احساسی مناسب از سوی دیگر، همچنان یکی از چالش های مهم برای ساخت ماشین های هوشمند محسوب می شود. در این مقاله، یک سیستم وابسته به گوینده برای تشخیص حس گفتار فارسی ارائه شده است. مراد از تشخیص حس وابسته به گویندة گفتار، شناسایی خودکار حالت احساسی یک یا چند گویندة خاص با استفاده از نمونه های گفتاری آنهاست. در طراحی سیستم معرفی شده، از روش های آماری استفاده شده است و معماری آن شامل دو بخش اصلی، استخراج ویژگی و آموزش مدل دسته‏بند می‏باشد. در مرحلة استخراج ویژگی، 28 ویژگی آکوستیکی شامل اطلاعات مربوط به فرکانس گام، ساخت سه فرمنت اول و دامنه از نمونه‎ های گفتار احساسی دو گوینده (یک مرد و یک زن) به طور مجزا و به ازای شش حس متفاوت خشم، تنفر، ترس، شادی، غم و خنثی استخراج شده است. پس از تشکیل بردار ویژگی، سه روش دسته بند، شامل ماشین بردار پشتیبان[i]، k نزدیکترین همسایه[ii] و شبکة عصبی[iii]، آموزش داده شده اند. در نهایت، سه روش پیاده سازی شده با استفاده از پار ه گفتارهای احساسی دادة آزمون ارزیابی شده و دقت و صحت و بازخوانی آنها مشخص شده است. با مقایسة عملکرد سه روش دسته بند مشخص شد که بیشترین دقت برای گویندة مرد و زن به ترتیب مربوط به ماشین بردار پشتیبان (97 درصد) و شبکة عصبی (93 درصد) بوده است. این در حالی است که در آزمون انسانی صورت گرفته، میانگین دقت انسان در تشخیص حس پاره گفتارهای احساسی دادة آزمون 78 درصد و کمتر از دقت روش های دسته بند گزارش شده در سیستم پیاده‏سازی شده است. [i]. support vector machine (svm) [ii]. k-nearest neighbor (knn) [iii]. neural network (nn)

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

تشخیص حس وابسته به گویندة گفتار فارسی با استفاده از ویژگی‌های آکوستیکی

بیان احساس در ارتباطات روزمره از جایگاه ویژه‌ای برخوردار است. از جمله بسترهای نمود احساس، گفتار است. از این‌رو، یکی از جنبه‌های مهم در طبیعی‌سازی ارتباط میان انسان و ماشین، تشخیص حس گفتار و تولید بازخورد متناسب با احساس درک‌شده است. باوجود پیشرفت‌های گسترده در حوزة پردازش گفتار، استخراج و درک احساس پنهان در گفتار انسان، همچون خشم، شادی و جز این‌ها، از یک‌سو و تولید گفتار احساسی مناسب از سوی دیگ...

متن کامل

تشخیص حس وابسته به گوینده گفتار فارسی با استفاده از ویژگی های آکوستیکی

بیان احساس در ارتباطات روزمره از جایگاه ویژه ای برخوردار است. از جمله بسترهای نمود احساس، گفتار است. از این رو، یکی از جنبه های مهم در طبیعی سازی ارتباط میان انسان و ماشین، تشخیص حس گفتار و تولید بازخورد متناسب با احساس درک شده است. باوجود پیشرفت های گسترده در حوزه پردازش گفتار، استخراج و درک احساس پنهان در گفتار انسان، همچون خشم، شادی و جز این ها، از یک سو و تولید گفتار احساسی مناسب از سوی دیگ...

متن کامل

تشخیص لهجه های زبان فارسی از روی سیگنال گفتار با استفاده از روش های استخراج ویژگی کارآمد و ترکیب طبقه بندها

Speech recognition has achieved great improvements recently. However, robustness is still one of the big problems, e.g. performance of recognition fluctuates sharply depending on the speaker, especially when the speaker has strong accent and difference Accents dramatically decrease the accuracy of an ASR system. In this paper we apply three new methods of feature extraction including Spectral C...

متن کامل

بررسی ویژگی های فیزیکی (آکوستیکی) واکه های زبان فارسی در گفتار بیماران زبان پریش

در این پژوهش، تولید شش واکه زبان فارسی در گفتار دو بیمار زبان­پریش با ضایعۀ بخش پیشین نیمکرۀ چپ مغز (یک زن و یک مرد)، با تولید این واکه­ها در گفتار چهار فرد سالم (دو زن و دو مرد) مقایسه­شد. طیف­نگاشت واکه­های آزمودنی­ها با استفاده از نرم­افزار praat به­دست­آمد. واکه­ها در گفتار زنان سالم کشیده­تر از واکه­های تولید­شده توسط مردان سالم بودند. ازسوی دیگر، بیمار مرد همه واکه­ها را کوتاه­تر و بیمار ...

متن کامل

تشخیص احساس ازسیگنال گفتار با استفاده از موجک بیونیک

تشخیص احساس برای رایانه امری چالش‌برانگیز است. دلیل اصلی این موضوع نیز عدم توانایی رایانه در درک احساس کاربر است. هدف از این مقاله، طراحی یک سیستم تشخیص احساس از گفتار و ارائة روشی نوین جهت بهبود این سیستم است. تاکنون در این زمینه از ویژگی‌های متفاوتی استفاده شده است، اما هیچ یک عملاً به ارتباط بین دامنة صوت و حالت‌های احساسی نپرداخته‌اند. چون موجک بیونیک به این ارتباط بیشتر پرداخته است، به‌نظر ...

متن کامل

مقایسه روش‌های مختلف یادگیری ماشین در خلاصه‌سازی استخراجی گفتار به گفتار فارسی بدون استفاده از رونوشت

In this paper, extractive speech summarization using different machine learning algorithms was investigated. The task of Speech summarization deals with extracting important and salient segments from speech in order to access, search, extract and browse speech files easier and in a less costly manner. In this paper, a new method for speech summarization without using automatic speech recognitio...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید


عنوان ژورنال:
مجله صوت و ارتعاش

ناشر: انجمن آکوستیک و ارتعاشات ایران

ISSN 2383-1839

دوره 2

شماره 4 2014

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023